\documentclass[a4paper]{report}
\usepackage[T1]{fontenc}
\usepackage{ae,aecompl}
\usepackage[utf8]{inputenc}
\usepackage{lmodern}
\usepackage[normalem]{ulem}

\let\tmpsection\section
\renewcommand{\section}{\newpage\tmpsection}

\title{Trabajo Práctico Final}
\author{}
\date{}

\begin{document}

\maketitle
\begin{abstract}
El trabajo consiste en un proyecto de minería de datos basado en sistemas inteligentes. En particular, trabajaremos con un set de datos sociodemográficos y de posesión de una cantidad de productos de clientes de una compñía de seguros. El mismo sera utilizado con el fin de determinar quienes estarían interesados en contratar una determinada póliza de seguros.
\end{abstract}
\thispagestyle{empty}
\newpage

\tableofcontents
\thispagestyle{empty}
\newpage

\section{Introducción}
En el trabajo práctico final intentaremos aplicar minería de datos basada en sistemas inteligentes, de forma tal que podamos obtener conclusioes, o estimaciones del problema propuesto. En particular, como grupo, hemos elegido el problema de predecir el interes de una población en contratar una póliza de seguros para el hogar. Para ellos, nos basaremos en un set de datos de una población  que contiene datos sociodemográficos y estadísticas sobre la posesión de otros productos.

\section{Set de datos}
El set de datos original en el cual nos basaremos posee los siguientes atributos.

\subsection{Diccionario de datos}
Expresado como NOMBRE: Descripción (Dominio)

\begin{enumerate}
  \item MOSTYPE: Subtipo de cliente (L0)
  \item MAANTHUI: Número de casa (1-10)
  \item MGEMOMV: Avg size household (1-6)
  \item MGEMLEEF: Edad promedio (L1)
  \item MOSHOOFD: Tipo de cliente (L2)
  \item MGODRK: Católico romano (L3)
  \item MGODPR: Protestante  (L3)
  \item MGODOV: Otra religión (L3)
  \item MGODGE: Ateo (L3)
  \item MRELGE: Casado (L3)
  \item MRELSA: En concuvinato (L3)
  \item MRELOV: Otra relación (L3)
  \item MFALLEEN: Soltero (L3)
  \item MFGEKIND: Familia sin hijos (L3)
  \item MFWEKIND: Familia con hijos (L3)
  \item MOPLHOOG: Educación de nivel alto (L3)
  \item MOPLMIDD: Educación de nivel medio (L3)
  \item MOPLLAAG: Educación de nivel bajo (L3)
  \item MBERHOOG: High status (L3)
  \item MBERZELF: Emprendedor (L3)
  \item MBERBOER: Granjero (L3)
  \item MBERMIDD: Middle management (L3)
  \item MBERARBG: Skilled labourers (L3)
  \item MBERARBO: Unskilled labourers (L3)
  \item MSKA: Social class A (L3)
  \item MSKB1: Social class B1 (L3)
  \item MSKB2: Social class B2 (L3)
  \item MSKC: Social class C (L3)
  \item MSKD: Social class D (L3)
  \item MHHUUR: Alquila casa (L3)
  \item MHKOOP: Dueño de casa (L3)
  \item MAUT1: 1 auto (L3)
  \item MAUT2: 2 autos (L3)
  \item MAUT0: Sin auto (L3)
  \item MZFONDS: National Health Service (L3)
  \item MZPART: Private health insurance (L3)
  \item MINKM30: Ingreso menor a 30.000 (L3)
  \item MINK3045: Ingreso entre 30-45.000 (L3)
  \item MINK4575: Ingreso entre 45-75.000 (L3)
  \item MINK7512: Ingreso entre 75-122.000 (L3)
  \item MINK123M: Ingreso mayor a 123.000 (L3)
  \item MINKGEM: Ingreso promedio
  \item MKOOPKLA: Clase de poder adquisitivo (L3)
  \item PWAPART: Contribution private third party insurance (L4)
  \item PWABEDR: Contribution third party insurance (firms) (L4)
  \item PWALAND: Contribution third party insurane (agriculture) (L4)
  \item PPERSAUT: Contribución a pólizas de seguro de autos (L4)
  \item PBESAUT: Contribución a pólizas de seguro de camionetas de delivery (L4)
  \item PMOTSCO: Contribución a pólizas de seguro de motocicletas/scooters (L4)
  \item PVRAAUT: Contribución a pólizas de seguro de camiones (L4)
  \item PAANHANG: Contribución a pólizas de seguro de trailers (L4)
  \item PTRACTOR: Contribución a pólizas de seguro de tractores (L4)
  \item PWERKT: Contribución a pólizas de seguro de máquinas agrícolas (L4)
  \item PBROM: Contribución a pólizas de seguro de ciclomotores (L4)
  \item PLEVEN: Contribución a pólizas de seguro de vida (L4)
  \item PPERSONG: Contribución a pólizas de seguro de accidentes privados (L4)
  \item PGEZONG: Contribución a pólizas de seguro de accidentes familiares (L4)
  \item PWAOREG: Contribución a pólizas de seguro de invalidez (L4)
  \item PBRAND: Contribución a pólizas de seguro de incendio (L4)
  \item PZEILPL: Contribución a pólizas de seguro de tablas de surf (L4)
  \item PPLEZIER: Contribución a pólizas de seguro de embarcaciones (L4)
  \item PFIETS: Contribución a pólizas de seguro de bicicletas (L4)
  \item PINBOED: Contribución a pólizas de seguro de propiedades (L4)
  \item PBYSTAND: Contribución a pólizas de seguro de seguridad social (L4)
  \item AWAPART: Number of private third party insurance (0-12)
  \item AWABEDR: Number of third party insurance (firms) (0-12)
  \item AWALAND: Number of third party insurane (agriculture) (0-12)
  \item APERSAUT: Número de pólizas de seguro de autos (0-12)
  \item ABESAUT: Número de pólizas de seguro de camionetas de delivery (0-12)
  \item AMOTSCO: Número de pólizas de seguro de motocicletas/scooters (0-12)
  \item AVRAAUT: Número de pólizas de seguro de camiones (0-12)
  \item AAANHANG: Número de pólizas de seguro de trailers (0-12)
  \item ATRACTOR: Número de pólizas de seguro de tractores (0-12)
  \item AWERKT: Número de pólizas de seguro de máquinas agrícolas (0-12)
  \item ABROM: Número de pólizas de seguro de ciclomotores (0-12)
  \item ALEVEN: Número de pólizas de seguro de vida (0-12)
  \item APERSONG: Número de pólizas de seguro por accidentes privados (0-12)
  \item AGEZONG: Número de pólizas de seguro por accidentes familiares (0-12)
  \item AWAOREG: Número de pólizas de seguro de invalidez (0-12)
  \item ABRAND: Número de pólizas de seguro por incendio (0-12)
  \item AZEILPL: Número de pólizas de seguro de tablas de surf (0-12)
  \item APLEZIER: Número de pólizas de seguro de embarcaciones (0-12)
  \item AFIETS: Número de pólizas de seguro de bicicletas (0-12)
  \item AINBOED: Número de pólizas de seguro de propiedad (0-12)
  \item ABYSTAND: Número de pólizas de seguro de seguridad social (0-12)
  \item CARAVAN: Número de pólizas de seguro de casas rodantes (0-1)
\end{enumerate}

\subsubsection{Dominios}

\subsubsection*{L0}
\begin{enumerate}
  \item High Income, expensive child
  \item Very Important Provincials
  \item High status seniors
  \item Affluent senior apartments
  \item Mixed seniors
  \item Career and childcare
  \item Dinki's (double income no kids)
  \item Middle class families
  \item Modern, complete families
  \item Familia estable
  \item Family starters
  \item Affluent young families
  \item Young all american family
  \item Junior cosmopolitan
  \item Senior cosmopolitans
  \item Students in apartments
  \item Fresh masters in the city
  \item Joven soltero
  \item Joven suburbano
  \item Etnically diverse
  \item Young urban have-nots
  \item Mixed apartment dwellers
  \item Young and rising
  \item Young, low educated 
  \item Young seniors in the city
  \item Own home elderly
  \item Seniors in apartments
  \item Residential elderly
  \item Porchless seniors: no front yard
  \item Religious elderly singles
  \item Low income catholics
  \item Mixed seniors
  \item Lower class large families
  \item Large family, employed child
  \item Village families
  \item Couples with teens 'Married with children'
  \item Mixed small town dwellers
  \item Traditional families
  \item Large religous families
  \item Large family farms
  \item Mixed rurals
\end{enumerate}

\subsubsection*{L1}
\begin{enumerate}
  \item 20-30 años
  \item 30-40 años
  \item 40-50 años
  \item 50-60 años
  \item 60-70 años
  \item 70-80 años
\end{enumerate}

\subsubsection*{L2}
\begin{enumerate}
  \item Successful hedonists
  \item Driven Growers
  \item Familia promedio
  \item Career Loners
  \item Living well
  \item Cruising Seniors
  \item Retirados y religiosos
  \item Family with grown ups
  \item Familias conservadoras
  \item Granjeros
\end{enumerate}

\subsubsection*{L3}
\begin{enumerate}
  \item 0\%
  \item 1 - 10\%
  \item 11 - 23\%
  \item 24 - 36\%
  \item 37 - 49\%
  \item 50 - 62\%
  \item 63 - 75\%
  \item 76 - 88\%
  \item 89 - 99\%
  \item 100\%
\end{enumerate}

\subsubsection*{L4}
\begin{enumerate}
  \item f 0
  \item f 1-49
  \item f 50-99
  \item f 100-199
  \item f 200-499
  \item f 500-999
  \item f 1000-4999
  \item f 5000-9999
  \item f 10.000-19.999
  \item f 20.000-?
\end{enumerate}

\subsection{Preparación de datos}
Dada la gran cantidad de atributos, debemos realizar limpieza de datos para aquellos que no aporten demasiado a la causa, y construcción de nuevos atributos que agrupen a aquellos que pueden tratar de la misma cosa.

\subsection{Limpieza de datos}

\subsubsection*{Religión}
Descartaremos los datos relacionados con la religión.
\begin{enumerate}
  \setcounter{enumi}{5}
  \item \sout{MGODRK: Católico romano (L3)}
  \item \sout{MGODPR: Protestante (L3)}
  \item \sout{MGODOV: Otra religión (L3)}
  \item \sout{MGODGE: Ateo (L3)}
\end{enumerate}

\subsubsection*{Ingreso}
De los siguientes atributos se tomará solamente el último de los atributos para representar el ingreso de la vivienda, y se descartarán el resto de los atributos de ingreso:
\begin{enumerate}
  \setcounter{enumi}{36}
  \item \sout{MINKM30: Ingreso menor a 30.000 (L3)}
  \item \sout{MINK3045: Ingreso entre 30-45.000 (L3)}
  \item \sout{MINK4575: Ingreso entre 45-75.000 (L3)}
  \item \sout{MINK7512: Ingreso entre 75-122.000 (L3)}
  \item \sout{MINK123M: Ingreso mayor a 123.000 (L3)}
  \item MINKGEM: Ingreso promedio
\end{enumerate}

\subsection{Construcción de datos}

\subsubsection*{Autos}
Calcularemos el promedio de autos y descartaremos los tres atributos que hacen referencia a los mismos.
\begin{enumerate}
  \setcounter{enumi}{31}
  \item \sout{MAUT1: 1 auto (L3)}
  \item \sout{MAUT2: 2 autos (L3)}
  \item \sout{MAUT0: Sin auto (L3)}
\end{enumerate}
\begin{itemize}
  \item MAUTAV: Promedio de autos
\end{itemize}

\subsubsection*{Nivel de educación}
Calcularemos el promedio del nivel de educación y descartaremos los tres atributos que hacen referencia a los mismos.
\begin{enumerate}
  \setcounter{enumi}{15}
  \item \sout{MOPLHOOG: Educación de nivel alto (L3)}
  \item \sout{MOPLMIDD: Educación de nivel medio (L3)}
  \item \sout{MOPLLAAG: Educación de nivel bajo (L3)}
\end{enumerate}
\begin{itemize}
  \item MOPLAV: Promedio de nivel de educación (alto, medio, bajo)
\end{itemize}

\subsubsection*{Número de pólizas de inmuebles}
Calcularemos la suma total de pólizas de inmuebles y la agruparemos en un único atributo.
\begin{enumerate}
  \setcounter{enumi}{73}
  \item \sout{AWERKT: Número de pólizas de seguro de máquinas agrícolas (0-12)}
  \setcounter{enumi}{79}
  \item \sout{ABRAND: Número de pólizas de seguro por incendio (0-12)}
  \setcounter{enumi}{83}
  \item \sout{AINBOED: Número de pólizas de seguro de propiedad (0-12)}
\end{enumerate}
\begin{itemize}
  \item POLSINM: Cantidad de pólizas de seguro de inmuebles (0-36)
\end{itemize}

\subsubsection*{Número de pólizas de transportes}
Calcularemos la suma total de pólizas de transportes y la agruparemos en un único atributo.
\begin{enumerate}
  \setcounter{enumi}{67}
  \item \sout{APERSAUT: Número de pólizas de seguro de autos (0-12)}
  \item \sout{ABESAUT: Número de pólizas de seguro de camionetas de delivery (0-12)}
  \item \sout{AMOTSCO: Número de pólizas de seguro de motocicletas/scooters (0-12)}
  \item \sout{AVRAAUT: Número de pólizas de seguro de camiones (0-12)}
  \item \sout{AAANHANG: Número de pólizas de seguro de trailers (0-12)}
  \item \sout{ATRACTOR: Número de pólizas de seguro de tractores (0-12)}
  \setcounter{enumi}{74}
  \item \sout{ABROM: Número de pólizas de seguro de ciclomotores (0-12)}
  \setcounter{enumi}{80}
  \item \sout{AZEILPL: Número de pólizas de seguro de tablas de surf (0-12)}
  \item \sout{APLEZIER: Número de pólizas de seguro de embarcaciones (0-12)}
  \item \sout{AFIETS: Número de pólizas de seguro de bicicletas (0-12)}
\end{enumerate}
\begin{itemize}
  \item POLSTRANS: Cantidad de pólizas de seguro de transportes (0-120)
\end{itemize}

\subsubsection*{Número de pólizas personales}
Calcularemos la suma total de pólizas personales y la agruparemos en un único atributo.
\begin{enumerate}
  \setcounter{enumi}{75}
  \item \sout{ALEVEN: Número de pólizas de seguro de vida (0-12)}
  \item \sout{APERSONG: Número de pólizas de seguro por accidentes privados (0-12)}
  \item \sout{AGEZONG: Número de pólizas de seguro por accidentes familiares (0-12)}
  \item \sout{AWAOREG: Número de pólizas de seguro de invalidez (0-12)}
  \setcounter{enumi}{84}
  \item \sout{ABYSTAND: Número de pólizas de seguro de seguridad social (0-12)}
\end{enumerate}
\begin{itemize}
  \item POLSPERS: Cantidad de pólizas de seguro personales (0-60)
\end{itemize}

\subsubsection*{Contribución a pólizas de inmuebles}
Calcularemos el promedio de la contribución pólizas de inmuebles y la agruparemos en un único atributo.
\begin{enumerate}
  \setcounter{enumi}{52}
  \item \sout{PWERKT: Contribución a pólizas de seguro de máquinas agrícolas (L4)}
  \setcounter{enumi}{58}
  \item \sout{PBRAND: Contribución a pólizas de seguro de incendio (L4)}
  \setcounter{enumi}{62}
  \item \sout{PINBOED: Contribución a pólizas de seguro de propiedades (L4)}
\end{enumerate}
\begin{itemize}
  \item CONTPERS: Contribución a pólizas de seguro de inmuebles (0-36)
\end{itemize}

\subsubsection*{Contribución a pólizas de transportes}
Calcularemos el promedio de la contribución pólizas de transportes y la agruparemos en un único atributo.
\begin{enumerate}
  \setcounter{enumi}{46}
  \item \sout{PPERSAUT: Contribución a pólizas de seguro de autos (L4)}
  \item \sout{PBESAUT: Contribución a pólizas de seguro de camionetas de delivery (L4)}
  \item \sout{PMOTSCO: Contribución a pólizas de seguro de motocicletas/scooters (L4)}
  \item \sout{PVRAAUT: Contribución a pólizas de seguro de camiones (L4)}
  \item \sout{PAANHANG: Contribución a pólizas de seguro de trailers (L4)}
  \item \sout{PTRACTOR: Contribución a pólizas de seguro de tractores (L4)}
  \setcounter{enumi}{53}
  \item \sout{PBROM: Contribución a pólizas de seguro de ciclomotores (L4)}
  \setcounter{enumi}{59}
  \item \sout{PZEILPL: Contribución a pólizas de seguro de tablas de surf (L4)}
  \item \sout{PPLEZIER: Contribución a pólizas de seguro de embarcaciones (L4)}
  \item \sout{PFIETS: Contribución a pólizas de seguro de bicicletas (L4)}
\end{enumerate}
\begin{itemize}
  \item CONTPERS: Contribución a pólizas de seguro de transportes (0-120)
\end{itemize}

\subsubsection*{Contribución a pólizas personales}
Calcularemos el promedio de la contribución pólizas personales y la agruparemos en un único atributo.
\begin{enumerate}
  \setcounter{enumi}{54}
  \item \sout{PLEVEN: Contribución a pólizas de seguro de vida (L4)}
  \item \sout{PPERSONG: Contribución a pólizas de seguro de accidentes privados (L4)}
  \item \sout{PGEZONG: Contribución a pólizas de seguro de accidentes familiares (L4)}
  \item \sout{PWAOREG: Contribución a pólizas de seguro de invalidez (L4)}
  \setcounter{enumi}{63}
  \item \sout{PBYSTAND: Contribución a pólizas de seguro de seguridad social (L4)}
\end{enumerate}
\begin{itemize}
  \item CONTPERS: Contribución a pólizas de seguro personales (0-60)
\end{itemize}

\subsection{Set de datos preparado}
Expresado como NOMBRE: Descripción (Dominio)

\begin{enumerate}
  \item MOSTYPE: Subtipo de cliente (L0)
  \item MAANTHUI: Número de casas (1-10)
  \item MGEMOMV: Promedio de habitantes por casa (1-6)
  \item MGEMLEEF: Edad promedio (L1)
  \item MOSHOOFD: Tipo de cliente (L2)
  \item MRELGE: Casado (L3)
  \item MRELSA: En concuvinato (L3)
  \item MRELOV: Otra relación (L3)
  \item MFALLEEN: Soltero (L3)
  \item MFGEKIND: Familia sin hijos (L3)
  \item MFWEKIND: Familia con hijos (L3)
  \item MOPLAV: Promedio de nivel de educación (alto, medio, bajo)
  \item MBERHOOG: High status (L3)
  \item MBERZELF: Emprendedor (L3)
  \item MBERBOER: Granjero (L3)
  \item MBERMIDD: Middle management (L3)
  \item MBERARBG: Skilled labourers (L3)
  \item MBERARBO: Unskilled labourers (L3)
  \item MSKA: Social class A (L3)
  \item MSKB1: Social class B1 (L3)
  \item MSKB2: Social class B2 (L3)
  \item MSKC: Social class C (L3)
  \item MSKD: Social class D (L3)
  \item MHHUUR: Alquila casa (L3)
  \item MHKOOP: Dueño de casa (L3)
  \item MAUTAV: Promedio de autos
  \item MZFONDS: National Health Service (L3)
  \item MZPART: Private health insurance (L3)
  \item MINKGEM: Ingreso promedio
  \item MKOOPKLA: Clase de poder adquisitivo (L3)
  \item PWAPART: Contribution private third party insurance (L4)
  \item PWABEDR: Contribution third party insurance (firms) (L4)
  \item PWALAND: Contribution third party insurane (agriculture) (L4)
  \item CONTSINM: Contribución a pólizas de seguro de inmuebles (0-36)
  \item CONTTRANS: Contribución a pólizas de seguro de transportes (0-120)
  \item CONTPERS: Contribución a pólizas de seguro personales (0-60)
  \item AWAPART: Number of private third party insurance (0-12)
  \item AWABEDR: Number of third party insurance (firms) (0-12)
  \item AWALAND: Number of third party insurane (agriculture) (0-12)
  \item POLSINM: Cantidad de pólizas de seguro de inmuebles (0-36)
  \item POLSTRANS: Cantidad de pólizas de seguro de transportes (0-120)
  \item POLSPERS: Cantidad de pólizas de seguro personales (0-60)
  \item CARAVAN: Número de pólizas de seguro de casas rodantes (0-1)
\end{enumerate}

\end{document}